Modelo de Acción-Mundo con Diffusion Transformer para Predicción AV
Un modelo Diffusion Transformer predice escenas de conducción con 4.8x mejor KID que la regresión, permitiendo simulaciones realistas y control de acciones.
Un modelo Diffusion Transformer predice escenas de conducción con 4.8x mejor KID que la regresión, permitiendo simulaciones realistas y control de acciones.